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This work focuses on the design and the development of a context ontology 
model , based on a domain ontology enriched, by lexico-semantic relations 
defining the lexical functions introduced by Mel'cuk in the Meaning-Text Theory, 
and by the concept of the context, in order to improve the analysis and the 
detection of meaning in text. This is motivated, by the fact that, unstructured 
data constitute the majority of produced contents, requiring for their 
exploitation, the development of tools and technologies allowing their 
integration into knowledge-based and reasoning-based systems. Existing 
technologies in the analysis and the extraction of semantic information from 
text can have a lot of imperfections; indeed, important elements such as concept 
of the context and use of all possible relations between terms, are not fully and 
formally supported. It is why we propose an extended model of a domain 
ontology as a context (in our case an ontology of fauna and flora), enriched by 
aspects that can help to address the cited problems. Such ontologies constitute 
the basis of an advanced approach for the detection and the extraction of 
contextual and semantic information from text, published in a parallel article 
(H.Fadili ACS/IEEE, 2013). 


Introduction 

Ce travail porte sur V elaboration d’un modele d’ ontologie de contexte a partir 
d’une ontologie de domaine enrichie par des relations lexico-semantiques 
definissant les fonctions lexicales de la Theorie Sens-Texte (Mel’cuk, 1988) et par 
la notion du contexte, dans un but d’ameliorer 1’ analyse et la detection semantique 
des donnees dans les documents de type textes. Cette demarche, s’interessant au 
traitement semantique des donnees non structurees, est motivee par le fait que, ce 
type de contenus constitue la majorite des donnees produites aujourd’hui, 
necessitant pour leur exploitation la mise en place d’outils et des technologies 
specifiques permettant leur integration dans les systemes a base de connaissances 
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et a base de raisonnements. Dans ce domaine, les technologies existantes relatives a 
1’ analyse et a 1’ extraction semantiques d’ i nf ormation peuvent representer beaucoup 
de lacunes du fait que des concepts importants, comme la notion de contexte et 
1’ exploitation de toutes les relations possibles entre les termes, n’y sont pas 
totalement pris en charge. 

C’est dans ce contexte que nous avons propose une nouvelle approche permettant 
d’ameliorer certains processus de gestion contextuelle de la semantique (Fadili, 
2013), basee sur les ontologies de domaine que nous ameliorons suivant un 
« modele » presente dans cet article. Le but est de detecter et de relever tous les « 
traits semantiques » relatifs a un contexte donne et d’augmenter ainsi l’efficacite de 
la formalisation du sens d’un texte afin qu’il soit compris et interprets par la 
« machine ». La modelisation de cette « relation » entre le texte et le contexte 
consiste dans la formalisation du sens en extrayant des mots et des relations 
permettant l’obtention d’un reseau semantique « contextualise » refletant 
fidelement le sens des contenus Studies. Concretement, elle permet de faire « la 
projection » du texte reprSsentS par l’arbre conceptuel (AC) (F.AMARDEILH, 
2009) issu des diffSrents processus du TAL « sur » le contexte reprSsentS par 
l’ontologie du contexte (OC) en utilisant les « relations lexico-sSmantiques » pour 
faire le « mapping » entre les concepts, mots, relations, instances, attributs, etc. des 
deux graphes. 

Nous avons tenu a mettre 1’ accent sur 1’ utilisation de ce type de relations parce que 
nous considSrons que c’est le moyen le plus sur permettant d’Sviter la dSperdition 
du sens et de relever toutes les nuances dans un contenu en rapport avec le contexte. 
En effet, nous considerons que si un mot est important et qu’il doit etre retenu dans 
un contexte, il en sera de meme pour les mots qui lui sont lies, tels que ses 
synonymes, ses antonymes, ses converses, ses generiques, ses specifiques, etc. La 
specificite de chaque type de relations lexico-semantiques est geree dans les 
differents algorithmes de la projection. Outre les mots simples, notre ontologie 
contient des mots composes. Ils sont codes ou indexes pour que la machine puisse 
les extraire facilement et leur reserver un traitement special. Cette demarche permet 
d’eviter toute ambiguite au niveau de 1’ interpretation. De par sa nature, cette 
approche peut etre utilisee dans beaucoup de domaines lies a la notion du contexte 
comme 1’ indexation « semantique » des donnees, la recherche linguistique ou 
semantique d’ information, 1’ extraction contextuelle d’ information, la gestion de 
corpus multilingues, la generation automatique de textes, etc. 

Le nombre des relations lexico-semantiques etant important, une soixantaine 
environ, nous essayons, a travers cette analyse, de ne prendre en compte (dans un 
premier temps) que certaines relations pour valider notre approche. Bien 
evidemment, 1’ extension a d’autres relations est possible suivant le meme principe. 

Dans cette recherche, nous experimentons le cas de la langue amazighe. La raison 
pour laquelle nous avons developpe et peuple, un modele de contexte base sur une 
ontologie du domaine de la faune et de la flore, enrichie par des relations lexico- 
semantiques. Dans ce qui suit, nous presentons une analyse des motivations des 
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choix de conception du modele, ainsi qu’un apergu de 1’ implementation de 
1’ ontologie 1 . 

Ontologies 

Definition 

D’une maniere generale, les ontologies reposent sur des outils de modelisation et 
de representation des connaissances permettant a des communautes d’ experts 
humains et logiciels d’un domaine donne de partager, d’une maniere consensuelle, 
un vocabulaire et de parler un meme langage, c’est-a-dire communiquer et se 
comprendre. Definir une ontologie d’une maniere precise est une tache tres difficile. 
Plusieurs definitions existent suivant le contexte d’ utilisation. Celle qui fait autorite 
aujourd’hui, au sein de la communaute scientifique, est celle de Gruber qui l’a 
definie comme suit : 

« Une ontologie est la specification d'une conceptualisation d'un domaine de 
connaissance ». En d’autres termes, une ontologie est un modele de representation 
de la formalisation d’une conception d’un domaine. La modelisation d’un domaine 
repose essentiellement sur deux aspects importants, la representation des 
connaissances et le raisonnement qui peut leur etre associe. La partie description 
permet de decrire et de formaliser le domaine en utilisant les notions de : classes, 
instances, attributs, relations, fonctions (ensembles de relations : simplification), 
restrictions (conditions sur certains elements), etc. La partie raisonnement, quant a 
elle, decrit les aspects dynamiques lies a une ontologie, a travers des regies (regies 
mettant en valeur les elements de 1’ ontologie), et des evenements (evenements 
modifiant certains attributs ou relations), etc. 

Quelques elements constitutifs 

Nous presentons dans ce qui suit des elements constitutifs de 1’ ontologie etudiee. 

1. Concepts et instances 

Les concepts represented des objets ou des idees. Ils sont organises en taxonomie 
au sein d’un reseau de concepts et structures hierarchiquement. Chaque concept est 
caracterise par un ensemble de proprietes : 


1 Concernant la notation des entrees lexicales, nous utiliserons le protocole suivant : 

- Voyelles : a, i, u et e pour noter le schwa. 

- Semi-voyelles : tv, y. 

- Consonnes : p, b, t, d, k, g, l, m, n, s, z, s, z, hie notent les fricatives pharyngales sourde 
et sonore, xlg les fricatives velaires sourde et sonore, h la spirante, q l’occlusive dorso- 
uvulaire, r la vibrante apicale. Le point sous la lettre indique l'emphase, le w en exposant 
note la labiovelarisation, le trait sous la lettre note la spirantisation, le dedoublement de la 
consonne indique la gemination. 
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- un concept est generique s’il exclut toute extension. Dans nos corpus, aucun 
concept ne releve de cette categorie. 

- un concept portant une propriete d 'identite permet de differencier deux instances 
de ce concept. 

- un concept est rigide s’il ne peut pas etre une instance d’autres concepts. 
Exemple : amuder « etre vivant » : 



Figure 1 : Concept rigide 

- un concept est anti-rigide lorsqu’il peut etre une instance pour d’autres concepts. 
Dans 1’ exemple ci-dessus « afgan», « amuder » et « tiskt » sont des concepts anti- 
rigides. 

Alors que le concept designe l’intention du concept, l’instance renvoie a l’element 
de 1’ ensemble constituant 1’ extension de concept. 

2. Relations entre concepts 

Au sein d’une ontologie, les concepts sont lies entre eux par des relations qui sont 
definies comme les liens entre des entites. Ces liens sont classes en deux 
categories : 

(1) Les relations hierarchiques lient des elements superieurs dits « hyperonymes » 
et des elements inferieurs dits « hyponymes ». De ce fait, l’hyperonyme englobe 
l’hyponyme. Exemple : 
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Ici, amuder est l’hyperonyme de afrux et islem ; afrux et islem sont les hyponymes 
de amuder. 

afrux et islem, par rapport aux autres entites, peuvent, a leur tour, etre consideres 
comme leurs hyperonymes. 

A ne pas oublier de mentionner que serdil « sardine » dans certaines regions 
comme la region des Ait Wirra a Elksiba (Maroc), joue le role de l’hyperonyme 
(generique), dans ce sens qu’il renvoie a tout type de poisson. 

(2) Les relations semantiques correspondent a la structuration d’holonymie- 
meronymie. Elies peuvent etre egalement considerees comme une relation 
hierarchique liant un couple de concepts dont l’un denote une partie de 1’ autre et 
1’ autre comme un tout. Ce genre de relation est different de la categorie (1) dans la 
mesure ou l’holonyme dispose des proprietes qui ne sont pas obligatoirement 
transmises a ses parties. Exemple : aqbu (tronc) est une partie de tiskt « arbre » 
mais n’est pas une sorte de tiskt. On peut representer cette relation comme suit (1) 
faune, (2) flore : 
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Figure 3 : Relations d’holonymie-meronymie 



Outre ces relations semantiques, les relations synonymiques et antonymiques, qui 
relevent des liens horizontaux, seront egalement abordees dans 1’ elaboration de 
notre ontologie. Exemple : iydi, buzaher, anmmuter, amhdaw « chien » ; iddew, 
abagus « singe ». 

3. Proprietes 

Ce sont des informations rattachees a chaque nceud du reseau semantique. 
Exemple : 
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4. Attributs 

Ce sont des relations qui relient un nceud concept a une valeur ou propriete. Ils 
definissent la structure de donnees. Exemple : 
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Figure 6 : Attributs 


5. L’ heritage 

II repose sur des liens de type « sorte de » ou « est un » qui relient un concept a un 
autre concept plus eleve. Ces liens sont etroitement lies a 1’ expression linguistique 
de la copule « est ». Ici, ils expriment soit l’appartenance d’un objet a une classe, 
soit l’inclusion. Exemple : 

« tayeuqt » est une sorte de « afrux ». 

« tayeuqt » est un « afrux ». 


6. Types 

En se basant sur certains travaux effectues dans le domaine de la classification 
d’ontologie (GomezPerez, 1999), (Guarino, 1997b), (Mizoguchi, 1998), 
(Mizoguchilkeda, 1996), (VanHeijstAl, 1997), (VanwelkenhuysenAl, 1994), 
(VanwelkenhuysenAl, 1995), (WieliingaSchreiber, 1993), etc., on peut en deduire 
la classification (dependante des besoins d’ utilisation) suivante : 

• L’ontologie de haut niveau definit et represente les concepts de haut niveau 
qui sont des concepts de 1’ uni vers de modelisation commun aux ontologies 
des niveaux inferieurs, comme la notion du temps, de l’espace, etc. Son 
role est de reduire les ambigui'tes des termes entre les differentes 
ontologies et utilisations. 

• L’ontologie generique se situe d’un point de vue abstraction entre 
l’ontologie de haut niveau et l’ontologie du domaine. Ses concepts sont 
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moins abstraits que 1’ ontologie de haut niveau et plus generiques par 
rapport a ceux de plusieurs ontologies de domaines, reutilisables par 
plusieurs domaines. 

• L’ ontologie de domaine represente et decrit les concepts se rapportant a un 
domaine donne. 

• L’ ontologie de taches represente et decrit le vocabulaire propre a une 
activite decrivant une structure de resolution d’un probleme. 

• L’ ontologie d’ application represente et decrit les concepts propres a une 
application. Dans la plupart des cas, ces concepts proviennent de 
1’ ontologie du domaine et de 1’ ontologie des taches. 

• L’ ontologie de representation represente et decrit les primitives des 
langages de representation et de formalisation de connaissances : RDF, 
OWL, reseau semantique, LD, LPO, etc. 

7. Les langages 

Les langages constituent une partie tres importante des systemes a base 
d’ ontologies ; ils permettent la gestion de la base de connaissances et de 
raisonnements qui peuvent leur etre associes. Les langages presentes dans ce 
paragraphe sont des recommandations du W3C, bases sur des normes, standards, 
etc. ayant pour but de permettre des traitements automatiques sur des contenus par 
des applications differentes. Nous verrons, un peu loin, que ceci fait de la notion 
d’ ontologie un principe fondamental pour le partage des connaissances, la 
communication et la cooperation au sein des systemes distribues. Ci-apres, nous 
reproduisons quelques elements de description de ces langages, extraits de la 
pyramide du Web semantique de Berners-Lee. 

URI/IRI : les URIs (Uniform Resource Identifier) permettent d’ identifier d’une 
maniere unique les ressources sur le WEB et les IRIs (Internationalized Resource 
Identifiers) permettent aux personnes d'identifier des ressources Web dans leur 
propre langue. 

XML : Extended Markup Language (XML) est un langage de description et 
d’echanges de documents et des donnees ne permettant pas leur presentation, 
appele aussi format d’echanges standardise. II permet aux applications 
reconnaissant ce format d’echanger tous les types de donnees decrits dans ce 
langage, utilise souvent pour assurer la compatibility des donnees entre les 
applications heterogenes. Exemple, on peut decrire la voiture 123 de la marque 
Renault et de couleur rouge. 

RDF : Resource Description Framework (RDF) est un metalangage qui sert a 
decrire les ressources, leurs proprietes et les valeurs des proprietes sous forme d’un 
graphe (ressource, propriete, valeur). II est considere comme un modele standardise 
de description des metadonnees qui peut etre defini et associe a des documents ou a 
des contenus. Ces annotations et metadonnees permettent d’associer du sens a des 
contenus qui peuvent etre traitees d’une maniere automatique par les agents 
logiciels. Pour la gestion semantique des donnees, les metadonnees RDF peuvent 
etre des informations semantiques associees a des mots du texte. Ces elements 
peuvent etre ensuite analyses et interprets pour F extraction du sens global. II est a 
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noter que RDF peut etre exprime dans plusieurs langages, mais c’est XML qui est 
souvent utilise, une version XML de RDF appelee RDF/XML a ete meme creee. 

RDFS : RDF peut egalement etre utilise pour decrire des situations et des 
utilisations particulieres avec un vocabulaire bien precis en utilisant la notion de 
RDF Schema (RDFS). RDFS consiste a adapter RDF a des domaines modelises 
particuliers decrivant des utilisations particulieres au sein d’une communaute. La 
definition d’un schema RDF consiste en une activite de typage et de classification 
des ressources, des proprietes et des relations sous forme de classes definies dans 
des « espaces de noms » servant principalement a desambigiiiser les memes 
elements d’un vocabulaire definis dans des utilisations ou espaces de noms 
differents. 

OWL : c’est une extension de RDF enrichie avec des proprietes semantiques, de 
contraintes, de comparaisons, de cardinality, etc. pour decrire et manipuler les 
ontologies. C’est un langage recommande par le W3C base, comme RDF, sur 
XML qui permet a des moteurs d’ inferences d’ agents F interpretation et le 
raisonnement automatiques sur les ontologies. En effet, OWL est base sur les 
logiques de description utilisees dans les systemes de representation de 
connaissances et offrant de fortes possibility de manipulation de predicats de 
classes, de roles et d’individus, done d’ ontologies, contrairement aux logiques de 
premier ordre classiques ne manipulant que des objets de meme type. 

II existe trois versions d’OWL : 

OWL Full : c’est la version la plus complete, elle combine toutes les primitives 
d’OWL avec RDF/S sans respecter aucune contrainte si ce n’est celle de RDF, 
cette version n’est pas decidable. 

OWL DL : c’est un sous-ensemble d’OWL Full base sur la logique de description 
n’autorisant que des constructions garantissant la decidability des i nf erences. 

OWL Lite : c’est la version la plus simple, elle sert principalement a la creation de 
hierarchies de classes. Elle est dotee seulement de quelques proprietes de classes 
comme la comparaison, la restriction, la cardinality (0 oul). 

SPARQL (Protocol and RDF Query Language) : langage d’ interrogation des 
ontologies representees sous forme de graphes RDF/S. II est pour les bases de 
connaissances RDF ce que SQL est pour les bases de donnees relationnelles. 
Exemple : SELECT ?x, ?y, ?z FROM URI/IRI WHERE { Conditions 1, condition 2, 
etc.} 

RIF (Rule Interchange Format) : format d’echange de regies standardise. II permet 
de faciliter les echanges de regies utilisables par des systemes distribues sur le 
WEB en assurant l'interoperabilite et la portability entre divers langages et moteurs 
de regies. 

SWRL (Semantic Web Rule Language) : langage de raisonnement semantique a 
base de regies sur les ontologies. C’est une combinaison d’OWL-DL et RuleML 
language cree principalement pour le Web semantique pour pouvoir developper des 
regies semantiques au niveau des agents. II permet, contrairement a OWL, de 
manipuler les instances par des variables, de definir des fonctions mathematiques, 
des types de donnees, etc. Exemple : avec OWL, la relation oncle ne pent etre 
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definie que comme suivant : intersectionOf(SubClassOf(Homme), estfrereDe(Pere), 
avec SWRL on peut la definir an niveau des instances representees par des 
variables x,y,z comme suivant : Personne(?x) A Personne(?y) A Personne(?z) A 
pere(?x,?y) A frere(?x,?z) => oncle(?z,?y). Cela permet de defin ir qui est l’oncle 
de qui, impossible a defin ir avec OWL. SWRL se differencie, en plus, d’OWL par 
le fait qu’il ne peut creer ni de nouveaux concepts ni de nouvelles relations, 
excepte ceux crees par la manipulation des variables et par la satisfaction des regies 
d’ inferences. 

Le choix des fonctions lexicales et des relations lexico-semantiques 

Les relations semantiques et conceptuelles 

Ci-apres, nous presentons un bref apcrcu sur les relations semantiques et 
conceptuelles qui nous ont permis d’introduire les relations lexico-semantiques 
utilisees dans notre demarche. 

Les relations semantiques sont les liens entre les elements du lexique dans le texte. 
Elies represented les liens de sens que peuvent entretenir deux ou plusieurs mots 
par rapport a leurs significations, comme les relations de type synonymie, 
antonymie, hyperonymie, etc. Les relations conceptuelles sont des relations ou 
associations utilisees dans la modelisation informatique. Elies permettent de faire 
des liens entre les classes et les instances. Dans le cas de la modelisation 
ontologique, nous pouvons bien sur utiliser ce genre de relation, mais ce sont les 
relations de types hierarchie et classification : heritage, classification comme « is- 
a, sort-of, part-of, etc. » qui sont privilegiees et souvent utilisees. 

Dans la litterature, une distinction est faite entre les relations semantiques Ahmad 
et Fulford (1992) et les relations conceptuelles Sager (1990) et Condamines et 
Rebeyrolle (1998). Dans L’Homme (2004), on explique la difference entre les 
relations conceptuelles et les relations semantiques. Dans d’autres travaux, on 
explique aussi que certaines relations semantiques sont tres proches des relations 
de representation conceptuelle : c’est le cas, notamment, de celles qui interviennent 
dans les taxinomies et les meronymies. Ce type de relation concerne, le plus 
souvent, des termes qui renvoient a des entites. 

On peut conclure qu’il est extremement difficile de faire une reelle difference entre 
ce qui releve du conceptuel et ce qui est lie au semantique. Les relations lexico- 
semantiques definies dans le cadre des fonctions lexicales de Mel'cuk est un 
modele de relations complet integrant au moins les deux types de relations definies 
precedemment. C’est une des raisons qui nous a permis de les adopter dans notre 
demarche. 

Les relations lexico-semantiques 

C’est suite a ces differentes analyses et experiences menees dans ce domaine que le 
choix de 1’ utilisation des relations lexico-semantiques definies par les fonctions 
lexicales (Mel'cuk 1988), (Mel'cuk et al., 1995) et (Polguere, 2003) s’est impose. 
Car elles permettent de representer tous les types de relations dont nous avons 
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besoin : semantiques, ontologiques, lexicales, etc. Nous considerons que cela 
permet une modelisation fine de tous les traits semantiques ameliorant le processus 
d’ analyse des textes et de detection de la semantique a travers une ontologie de 
contexte. En effet, 1’ utilisation de ces relations est importante. Elle permet, dans le 
cas de la recherche ou de 1’ extraction d’ information, par exemple, d’eviter 
d’ignorer des mots ou des phrases bien qu’ils soient pertinents par rapport a un 
contexte (silence). Elle permet egalement d’eviter d’extraire des mots ou des 
phrases non pertinentes (bruit). On considere que si un mot est pertinent dans un 
contexte, alors tous les mots que l’on peut atteindre via les relations lexico- 
semantiques sont aussi importants que le mot lui-meme. 

Suivant le nombre des relations utilisees, la probabilite qu’un mot et ceux qui lui 
sont semantiquement lies soient consideres est superieure a la probabilite ne tenant 
compte que du mot seul. L’ utilisation de ces relations peut done avoir un impact 
tres positif sur 1’ amelioration des performances des applications ou elles peuvent 
etre utilisees. 

Fonctions lexicales 

Comme il a ete mentionne ci-dessus, le present travail porte sur T elaboration d’un 
modele d’ ontologies de domaine enrichie par des liens lexico-semantiques associes 
aux fonctions lexicales de la Theorie Sens-Texte (Mel’cuk, 1997) et la notion du 
contexte, dans un but d’ameliorer 1’ analyse et la detection semantique des donnees 
dans les documents de type textes. La Theorie Sens-Texte est un cadre theorique 
linguistique, developpee a Moscou par Aleksandr Zolkovskij et Igor Mel'cuk, pour 
la construction de modeles du langage naturel Mel'cuk (1981) et (1988). C’est une 
des theories majeures pour le Traitement Automatique des Langues fournissant des 
bases solides pour beaucoup de domaines d’ application lies au traitement 
automatique de la semantique, comme la traduction automatique, la recherche 
semantique ou linguistique, T extraction d’ information, etc. Elle est basee sur une 
formalisation globale de la langue utilisant des fonctions mathematiques 
definissant les fonctions lexicales, comme suivant : 

Une fonction lexicale (FL) permet de definir la description et la modelisation des 
relations lexicales, de collocations et de derivation semantique entre les unites 
lexicales (UL) d'une langue. Elle se presente sous forme d’une fonction au sens 
mathematique : f (L) — {LI, L2...Ln} oil f - le nom de la FL, L = lexie qui est 
Vargument de la FL et {LI, L2.„Ln} = ensemble des lexies qui constituent la 
valeur de la FL aupres de L, cf. Zolkovskij & Mel'cuk 1967, Mel'cukl974, 1996, 
1998, 2003, 2007, et Wanner (ed.) 1996. 

Voici un extrait de la liste des fonctions lexicales : 

Syn, Anti, Conv,,, Contr, Epit, Gener, Figur, S 0 , Ao, V 0 , Adv 0 , S„ S ins ,r, S med , S mod , 
Sioc, S res , Able;, Qual ; , Sing, Mult, Cap, Equip, A,, Adv,, Imper, Result, Centr, 
Magn, Plus, Minus, Ver, Bon, Pos ; , Loc in , Loc ab , Loc ad , Instr, Propt, Copul, Pred, 
Opeq, Func;, Labor,,, Incep, Cont, Fin, Caus, Perm, Liqu, Real;, Fact;, Labrcal,,, 
Involv, Manif, Prox, Prcpar,, Degrad, Son, Obstr ; , Stop;, Excess;, Sympty k . 
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Parmi toutes les fonctions lexicales, deux groupes sont a distinguer : les FL 
PARADIGM ATIQUES et les FL SYNTAGMATIQUES. 

Dans ce qui suit, on trouvera un bref apery u sur quelques fonctions, les principales 
sur lesquelles des tests ont ete effectues dans le cadre de ce travail. Une etude 
detaillee de toutes les fonctions ainsi que leur integration dans le processus 
d’ analyse et de detection est prevue dans un travail ulterieur. 

Les fonctions lexicales paradigmatiques permettent de definir les liens entre les 
lexies et la maniere dont l’une peut etre atteinte a partir de 1’ autre. Elies 
correspondent a des relations a la fois semantiques et formelles entre deux mots. 
Exemples : 

- Syn, qui met en relation une entite avec ses parasynonymes : Syn( iydi)-bu- 
zaher, amhdar. 

Anti, qui met en relation une entite avec ses antonymes : 
An ti( amsksum ) = amstuyya, 

- Conv, qui prend en consideration les relations de conversions entre deux entries : 
conv( isga ) - izzenza. 


La notion de contexte et 1’ ontologie de contexte 
Le contexte 

La notion de contexte constitue un element fondamental dans plusieurs domaines, 
notamment dans le domaine du Traitement Automatique du Langage Naturel 
(TALN), l'analyse semantique de donnees, la gestion de connaissances (Semantic 
Data Mining & Knowledge Management : SDMKM), etc. oil l’on utilise plus 
particulierement au niveau de la desambiguisation et de 1’ interpretation 
automatiques de la semantique des donnees On peut le defin ir comme un ensemble 
de situations, oil chaque situation est composee d’un domaine, d’un ensemble de 
contraintes d’ utilisation et d’un profil utilisateur. II peut etre represente par un 
ensemble de proprietes decrivant des situations d’utilisations particulieres et un 
vocabulaire associe au domaine modelise. Ces elements peuvent etre partages au 
sein d’une meme communaute et representes sous forme d’une ontologie 
echangeable entre les differents agents humains et logiciels. Ce qui leur permet de 
parler un meme langage et d’ interpreter les elements de la meme maniere. 

Concretement, le contexte est compose : 

• D’un domaine defini par un schema representant une activite de typage et 
de classification des ressources, des proprietes et des relations sous forme 
de classes dans des « espaces de noms » servant principalement a 
desambiguiser les memes elements d’un vocabulaire par rapport a des 
utilisations ou espaces de noms differents. 

• Contraintes definies par des regies representant les contraintes d’une 
utilisation particuliere, comme par exemple inclure et exclure des elements 
qui seraient respectivement exclus et y inclus du domaine, cela correspond 
a un reglage fin supplementaire de 1’ ontologie du domaine. Des elements 
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issus de la theorie du discours peuvent etre integres dans cette partie. On 
peut citer dans ce cas-la et a titre d’exemple, 1’ interpretation de certains 
elements suivant leur auteur, le message qu’on souhaite extraire du texte, 
etc. 

• Profil utilisateur qui est un element important de la notion de contexte. 
Cela peut correspondre dans le cas de 1’ analyse du texte a ce qui est percu 
par le lecteur suivant ses competences, experiences, etc. 

Une vue synthetique du meta-modele de la notion de contexte est representee 
dans le graphe suivant. 



Figure 7 : Meta-modele du contexte 
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L’ ontologie de contexte 

Dans cette etude, nous avons concu et developpe une ontologie du contexte 
integrable dans le processus general de 1’ analyse semantique et contextuelle du 
texte, propose dans un travail parallele (H.Fadili ACS/IEEE, 2013). C’est une 
ontologie du domaine que nous avons enrichie par la notion de contexte et les 
relations lexico-semantiques decrites precedemment. En effet, etant donne que 
1’ ontologie du domaine est seulement une ontologie conceptuelle du domaine 
etudie, nous avons estime qu’il est indispensable, pour 1’ analyse semantique a 
proprement dit, d’enrichir l’ontologie du domaine classique par des relations 
lexico-semantiques permettant de prendre en compte, outre les relations 
conceptuelles entre les concepts, les relations lexico-semantiques. Cette demarche 
rend possible une analyse linguistique de bas niveau entre les mots dans le contexte. 
Elle peut etre consideree comme une ontologie du domaine fusionnee avec une 
ontologie linguistique, definie par deux types de liens : liens verticaux 
(contextualises) qui sont des liens de categorisation, et les liens horizontaux 
(decontextualises) sont des liens linguistiques (relations lexico-semantiques, 
actions, verbes, etc.). Tous ces elements pris en compte, sont enrichis par des 
contraintes d’ utilisation. 



Figure 8 : Meta-modele de V ontologie du contexte 

Constitution du corpus 

D’une maniere generale, la constitution d’une ontologie est une tache tres difficile ; 
cette tache est encore plus difficile dans le cas de l’amazighe. Dans cette partie, 
l’objectif est de relever les exigences et les problemes a resoudre pour la creation 
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d’une telle ontologie en amazighe. Parmi lesquelles, on cite, les problemes 
classiques lies a la creation et a la gestion du corpus, d’une maniere generale, puis 
ceux lies a la creation et a la gestion de corpus amazighs, en particular. A 
mentionner que la definition des termes scientifiques dans 1’ ontologie qui consiste 
dans la recherche, la creation ou la reutilisation de termes scientifiques ou savants 
par rapport a un domaine ou a une discipline donnee n’est pas sans poser probleme. 

Dans ce qui suit, nous presentons les difficultes rencontrees, lors de la mise en 
place de V ontologie scientifique faune-flore, en amazighe : 

1. Nous nous sommes rendus compte que des donnees sources, que ce soit des 
donnees brutes y compris papier, ou des donnees electroniques, sont tres rares : 

Absence de sources de donnees, seulement quelques publications. 

2. D’autres problemes sont lies a la creation de nouveaux contenus : 

- Mots, concepts, etc., 

- Relations, 

- Lexique scientifique, 

- Problemes de traduction, 

- Traduction des mots scientifiques, 

- Creation de liens et des correspondances avec d’autres langues. 

3. Applications avancees supportant le Tifinagh 

- Absence d’ applications totalement multilingues, problemes rencontres 
avec les editeurs d’ ontologies dans le Cloud2 par exemple. 

4. Copyright 

- Manque de donnees ouvertes et libres d’acces, 

- Non institutionnalisation de la langue, ne permet pas la creation de 
nouvelles donnees publiques. 

Quelques solutions de contournements 

Au niveau du contenu 

Concernant la definition des concepts, nous nous sommes bases sur notre 
connaissance de la langue amazighe, sur des dictionnaires specialises et sur 
d’autres sources de donnees existantes. 

Pour ce qui est de la definition des termes, il a ete precede ainsi : 

1. Etant donne que les termes traites sont des entites du monde reel, nous avons 
defini chaque mot connu par ses relations et ses proprietes avant de l’inserer dans 
1’ ontologie. 


2 Le cloud ou le cloud computing (le nuage en Francais) est une technologie permettant la 
mutualisation des services et ressources informatiques ouverts en libre service. 


162 



Conception et peuplement d'une ontologie modelisant la notion de contexte enrichie par les fonctions 
lexicales pour la detection du sens dans le texte. Parler du Maroc central 

2. Un mot non connu est traduit a partir d’autres langues. Dans certains cas, on a 
precede par l’emprunt des termes les plus utilises dans le langage courant : darija, 
arabe standard ou fran£ais, etc. 

Au niveau technologique 

Afin de rester conforme aux normes internationales, nous avons utilise trois 
categories de relations : 

• les versions anglaises des relations de hierarchisation OWL, 

• les relations lexico-semantiques dans leur version normalisee, 

• puis les relations en amazighe pour les autres. 

Ces regies ont ete utilisees pour les proprietes (les proprietes hors la norme OWL). 

Pour la graphie, faute de compatibility avec le Tifinagh, nous avons opte, quant a 
cette premiere version de V ontologie, pour la transcription phonetique. Une version 
en Tifinagh est prevue dans les versions futures. 


I LzJ 
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Part-O: 'title'. 

References: [id] ('http://uri.net’) . 
Title: 'title'. 

Namespace: 'http://uri.net'. 
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Figure 9 : Editeur facile 

Afin d’accelerer la saisie, nous avons contourne, dans un premier temps, 
1’ utilisation directe de Y interface Knoodl qui peut paraitre difficile, nous avons 
utilise 1’ application et la notation « Fluent editeur » base sur 1’ anglais controle pour 
saisir facilement les donnees de 1’ ontologie, avant de les convertir en OWL et les 
importer dans la plateforme finale de travail (knoodl). 
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La saisie de fait en respectant la grammaire du CNL pour 1’ anglais comme suivant : 

(1) Every abagus is an amuder. 

Every abrrid is an amuder. 

Every abrrid-n-taydwin is an amuder. 

Every abulxir is an amuder. 

Every add-n-wusen is an amuder. 

Every afrux is an amuder. 

Every afullus is an amuder. 

Every agyul is an amuder. 

Every ag'ilas is an amuder. 

Every agerday-n-lxla is an amuder. 

Every ahuliy is an amuder. 

Every asitar is an amuder. 

Every ayis-n-lbher is an amuder. 

(2) Every azmmur is an tiskt. 

Every tasaft_ is an tiskt. 

Every tasmmumt is an tiskt. 

Every tasta is an tiskt. 

Every taylilut is an tiskt. 

Every tiqqi is an tiskt. 

Apres cela, on precede a un export en RDF, facilement integrable de dans la 
plateforme finale. 

- <Class rdf:about= http://ontorion.com/unknown.owl/a3sat-mussa ’> 

<rdfs:subClassOf rdf: resource= http://ontorion.com/ unknow n.owl/asklu"/> 
</Class> 

<! — http://ontorion.com/unknown.owl/a3ud-lqmar — > 

- < Class rdf : a bout = "http://ontorion.com/unknown.owl/a3ud-lqmar"> 

<rdfs:subClassOf rdf: resource = http://ontorion.com/unknown.owl/asklu7> 

</Class> 

< ! — http://ontorion.com/unknown.owl/a3ud-nwar — > 

- cClass rdf : a bout = "http: / / ontorion.com / unknown.owl/a3ud-nwar"> 

<rdfs:subClassOf rdf: resource= http://ontorion.com/ unknown.owl/asklu"/> 

</Class> 

< ! — http://ontorion.com/unknown.owl/abagus — > 

- cClass rdf:about= "http://ontorion.com/unknown.owl/abagus ’> 

<rdfs:subClassOf rdf: resource= http:// ontorion.com/unknown.owl/aywal7> 

</Class> 

<! — http://ontorion.com/unknown.owl/abrrid — > 

- cClass rdf:about= "http://ontorion.com/unknown.owl/abrrid"> 

<rdfs:subClassOf rdf: resource= 'http://ontorion.com/unknown.owl/aywal7> 
</Class> 

< ! — http://ontorion.com/unknown.owl/abrrid-n-taydwin — > 

- cClass rdf : a bout = "http://ontorion.com/unknown.owl/abrrid-n-taydwin”> 

crdfs:subClassOf rdf: resource= http:/ / ontorion.com / unknown.owl /ay wal"/> 

c/Class> 

c! — http://ontorion.com/unknown.owl/abulxir — > 

- cClass rdf:about= http://ontorion.com/unknown.owl/abulxir > 

crdfs:subClassOf rdf: resource= http:// ontorion.com/ unknown.owl/aywal "/> 
c/Class> 

c! — http://ontorion.com/unknown.owl/adar-n-ufullu — > 

- cClass rdf : a bout = "http://ontorion.com/unknown.owl/adar-n-ufullu" > 

crdfs:subClassOf rdf: resource= http://ontorion.com/unknown.owl/asklu7> 
c/Class> 


Figure 10 : Version RDF 
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Elements sur 1’ implementation 
Elements de V ontologie 

Ci-dessous une presentation illustrative de cette methode. Dans un premier temps, 
nous presentons des relations simples des etres et dans un deuxieme temps des 
relations complexes : 

1. La hierarchie simple des etres. On parle ici des relations aui « specifient les 
relations verticales de 1’ ontologie, et se resument a des formes de subsomption. de 
1’ element par la classe (relation is a) ou de la partie par le tout (relation has a). Ces 
relations sont determinantes, car toute ontologie a une fonction unificatrice, l’Etre 
etant defini par son unite a soi » (Rastier 2004). 

Exemple : 

1 . Relations de base 

Every izem is an amuder. 

Pour aller plus loin. 

Every aserdun is an amuder. 

Every amuder amsksum is an amuder. 

Every amuder amstuyya is an amuder. 

Every tafunast is an amuder amstuyya 

On traite egalement la flore. 

Every azmmur is a tiskt 
Every tasmmumt is a tuyrya 
Every tazdayt is a tiskt 
Every bu-hmmu is a tuyya 
Every alili is a tiskt 
Every tamemt n waman is a tiskt 
Every tisi Os a tiskt 

2. attributs et specifications 
Every tiskt ittuyatsan is a tiskt 

3. Disjointes 

Every amuder is not a tiskt. 

Every tixsi is not a aserdun. 

Every tiskt is not a amuder. 

4. Les relations simples 

Every izem da-i-tt-tta a tamlalt 
Every imissaw da-i-tt-tta an agar day. 
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Every tafunast da-tt-tta a tuyya. 

Every iydi da-i-tt-tta an aksum. 

5. Les relations complexes 

Every IfSSa is something that i-tt-tta an amuder and da-i-tt-tta timzin and da-t-tt-tta 
a ag'las. 

If X i-yya zi something that i-ttu-yyan zi Y then X is -i-yya zi Y. 

6. Equivalence 

Something is a amuder amsksum if-and-only-if-it da-i-tt-tta nothing-but amuder 
and-or da-i-tt-tta nothing-but thing that i-yyan zi an amuder. 

Something is an anarmu if-and-only-if-da-i-tt-tta an amuder and i-tt-tta an tiskt and 
i-tt-tta a thing that i-yyan zi an amuder and-or i-yyan-zi a tiskt. 

Something is a amstuyya if-and-only-if-it i-tt-tta nothing-but tiskt and-or i-tt-ttan 
nothing-but thing that i-yyan zi tiskt. 

7. Disjointnes 

Anything either is an anarmu, is an amstuyya or is an amsksum or-something-else. 

8. Relations entre les entites 

X i-yyanzi Y if-and-only-if Y i-ttuyya zi X. 

X da-i-tt-tta Y if-and-only-if Y da-i-ttuyatsa zi X. 

Specifications techniques 

Pour la mise en place de l’ontologie, nous avons utilise la plateforme knoodl. C’est 
une solution de gestion d’ ontologies dans le Cloud. Elle est dotee de plusieurs 
services permettant une gestion collaborative d’ ontologies, de gestion de 
communautes, des wiki, des liens avec d’autres ontologies et donnees, etc. Ce 
choix a ete motive, entre autres, par le fait que cette technologie permet de profiter 
d’une part de la technologie du Cloud ne necessitant aucune installation ni 
maintenance de solutions logicielles et materielles, dans un esprit communautaire 
pour la creation et la maintenance de ce type de contenus. Concretement, knoodl 
permet notamment la creation, la gestion et 1’ analyse des donnees de type 
RDF/OWL. Cette solution integre en plus des fonctionnalites avancees comme : 
1’ import/export de contenus de type RDF/OWL, 1’ interrogation SPARQL, 
visualisation des sources de donnees, des vues d’ analyse, des visualisations 
graphiques, etc. 

C’est une solution gratuite hebergee dans le cloud d’ Amazon EC2. 


166 


Conception et peuplement d'une ontologie modelisant la notion de contexte enrichie par les fonctions 
lexicales pour la detection du sens dans le texte. Parler du Maroc central 


Apergu sur Vontologie (lafaune et la flore en amazighe) 

L’ ontologie a ete contjue en se basant sur les relations conceptuelles et lexico- 
semantiques, comme representee dans le meta-modele precedent. 


knoodl 


Knoodl My account Community Contents File Edit 

Ontologie de la faune et la flore en amazigh VI 

Community faune_flore_amazigh vocabulary Ontologie_de_la_faune_et_la_flore_en_amazigh_V1 version 1.0 
[§ ClassasH I Properties | 

B C aywal [ ns4: ] 

B 3 (aba ayw) 

f+1 C abagus [ ns4: ] 

H [C] abrrid [ ns4: ] 

c abrrid-n-taydwin [ ns4: ] 

1+1 C abubcir [ ns4: ] 
r*l C adibn-wusen [ ns4: ] 
m c afrukh [ ns4: ] 
t±) C afullus [ ns4: ] 

H [c ahulry [ ns4: ] 
m C akhzuz [ ns4: ] 

H C akjqag [ ns4: ] 

H [Cj amlal [ ns4: ] 

P*1 q anugudh [ ns4: ] 
t±) Q aqwnin [ ns4: ] 

H C aqziz [ ns4: ] 

P*1 c aserdun [ ns4: ] 
m Q awtul [ ns4: ] 

H (C awttuf [ ns4: ] 

[+] c a y® [ ns4: 1 

1+1 C ayis-n-lbher [ ns4: 1 
P*1 C ayis-n-waman [ ns4: ] 

[±] [C ayru [ ns4: ] 

B C aywal-itt-ttan-iskwia [ ns4: ] 

Figure 11: Extrait de Vontologie d partir du Cloud (Knoodl) 

C’est une ontologie du domaine sur la faune et la flore en amazighe enrichie par 
des elements linguistiques, integrable dans notre demarche d’ analyse et 
d’ extraction semantiques des donnees a partir du texte. 

Quelques elements statistiques sur le contenu de Vontologie 

A l’etat actuel du developpement de 1’ ontologie, nous avons integre au format 
RDF : 

- Plus que 1500 concepts, 

- Plus que 3000 relations (conceptuelles, ontologiques, semantiques, etc.), 


View Graph RDF || Discussion Edit [| History | 


Contents 

1 Technical Specifications 
1.2 Overview 


Technical Specifications 


Overview 


Ontology Name 


http://www.ontorion.com/ontologies/Ontologydc89eb1fe 


Dependencies 


Namespaces 

http://www.knoodl.com/group/faune_flore_ 
dc: http://purl.Org/dc/elements/1. 1/ 

ns4 : http://ontorion . com/unknown . owl/ 
ns5: http://www.ontorion.com/ontologies/Ontolc 
owl : http://www.w3 . org/2002/07/owl# 
rdf. http://www.w3.Org/1 999/02/22-rdf-syntax-n 
rdfs: http://www.w3.Org/2000/01/rdf-schema# 
Imports 

(nothing) 
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- Quelques contraintes types. 

Cette ontologie est prete a etre utilisee dans notre processus d’ analyse semantique 
des textes. A la fin de son developpement, nous envisageons de l’integrer dans le 
Cloud du Linked Open Data (LOD). 

Conclusion et perspectives 

Bien qu’il existe des systemes capables d’analyser et de traiter des contenus d’un 
point de vue semantique, la relation qui lie le contenu a son utilisation est 
generalement peu ou pas du tout prise en compte. En effet, cette relation peut etre 
d’une extreme complexity qui necessite des approches et systemes intelligents 
difficiles a mettre en oeuvre et capable de s’ adapter en fonction du contexte 
d’ utilisation. Dans cet article, nous avons presente la conception d’une ontologie de 
contexte a partir d’une ontologie de domaine enrichie par la notion de contexte et 
les relations lexico-semantiques, integrable dans une approche de gestion de la 
semantique dans son contexte. Ceci, afin d’ameliorer les performances de certains 
domaines d’ application comme 1’ indexation, la recherche ou encore 1’ extraction 
d’ information. On a pu, a travers quelques exemples de relations et de definition 
particuliere du contexte, repondre aux soucis relatifs a des enonces ou a des mots 
auxquels peuvent correspondre plusieurs et differentes structures semantiques en 
analysant fidelement les relations semantiques que peuvent entretenir les mots 
simples, voire les expressions figees au sein d’un meme texte et qui releve d’un 
meme domaine, ainsi que les regies de raisonnement qui leur sont applicables. Une 
extension de cette etude a toutes les relations, une etude approfondie des 
specificites de chaque relation ainsi que son utilisation constituent les perspectives 
du present travail. On appliquera les resultats de ces ameliorations pour affiner « la 
pertinence » et « l’optimisation » dans des domaines et des utilisations particuliers. 
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